package com.kongchengji.spider.station.process;

import com.kongchengji.spider.station.constant.Constant;
import us.codecraft.webmagic.processor.PageProcessor;

import java.util.List;
import java.util.regex.Pattern;


/**
 * 该接口只适用于通过一个页面可以获得所有栏目,然后通过栏目获取列表，最终获得内容页
 */
public interface AnalysisRequestInerface extends PageProcessor {
    /**
     * 列表页处理器
     * @param response 列表页的结果
     * @param patterns 需要从列表页结果提取规则
     * @return 返回提取结果
     */
     List<String> listHandler(String response, Pattern ...patterns);

    /**
     * 内容页处理
     * @param urlList 内容页连接
     */
     void contentHandler(List<String> urlList, Constant.Station station,String... rules)throws Exception;

    /**
     * 根据字符串组装url
     * @param subUrl
     * @return
     */
     String combineUrl(String...subUrl);






}
